数据的质量控制
NailaBaigAnsari
AgaKhan大学社区卫生科学学院研究员
巴勒斯坦卡拉奇
xhlbudd(dxy)译
学习目标
●知道科研研究不同阶段数据质量保证和控制的必需步骤。
●弄清楚引导试验与预试验的区别。
●知道设计数据搜集手段的重要性。
●知道如何使用审计追踪来管理数据以及检查已录入的数据库的方法。
行为目标
●知道质量保证和质量控制的区别以及它们实现的途径。
●知道引导试验和预试验的目的。
●知道数据搜集手段如何设计,如何编码。
●知道用审计追踪来管理数据。
●能够检查数据库中的错误并纠正它们。
数据的质量控制
●质量保证在搜集数据之前确保数据质量的行为
●质量控制在研究过程中监控和维持。
数据质量
数据管理在研究过程中处使用和处理数据
质量保证的步骤
●阐明研究假设。
●阐明研究假设的检测方法的设计,即提出一种研究草案。
●选择或者准备特定的方法手段。
●制定数据搜集和处理的程序,即制定操作手册。
●工作人员的培训以及工作人员素质的保证。
●素质有保证的工作人员,预试验,引导研究数据搜集以及方法和程序的处理质量保证:程序的标准化。
●为什么标准化非常重要
为了使整个研究的数据搜集过程达到最高程度的统一和标准化。
制订操作手册的准备工作
每个数据搜集手段过程的执行过程的详细描述。(比如说BP)
一个问题接着一个问题的访问方法。
质量保证:工作人员的培训
●目标是让每一位员工熟悉他(她)所负责的问题的程序。
●工作人员执行特定程序的培训证明。
质量保证:预试验和引导试验
●预试验
包括对一个样品用特定的程序进行评估以检测是否在大问题。
引导试验
研究过程的正式排练。
再现与参与者尽可能相类似的样品的整体操作流程。
预试验和引导试验的结果
●用于评估的问卷预试验
问题的流程
敏感问题的提出
参数的近似分类
让访问者弄清连续发问的程序
引导试验
除了上面的内容,还有程序的流程
质量保证:数据管理
●设计数据搜集方法
●列出要问的问题,问题的顺序,问题的措词,问题答案的分类,跳跃性的发问方式搜集并记录原始数据,而不是经过处理加工的数据(比如说“年龄”)。
密码本:问卷与输入电脑的数据的联系。
质量保证:代码本的使用。
●变量名
由超过8个的字母或数字组成,第一个字符应当是字母。
问题编号与描述结合(如q3age)。
含义:
变量含义的简洁描述。
SPSS软件能够在输出结果中整合变量标记并显示它。
●代码
尝试并运用数字代码
预先决定无应答,数值丢失的代码。
●不方便问的问题或者不适用的问题(比如说怀孕的结果)问题已经提出但是没有得到应答(比如说工资的问题)。
被访问者回答“不知道”
质量控制
对工作人员明显偏离预定草案的程序和行为进行监测。
策略包括:
工作人员的密切观察。
选择所有的访问并随机抽取一个样本进行回顾。
正在进行的研究的领域的监督。
在办公室进行编辑(包含编码)
用统计学方法从长远的角度评估每位观察者、访问者和技术人员的表现数据管理:审计追踪。
研究者必须能够从每一个信息追溯到原始文件。
原始文件和数据库中的ID.
所有数据的改正必须记录并且加以解释。
所有对数据库的修改必须用命令文件加以记录。
所有分析结果必须用一个命令文件记录下来。
审计的目的是:
不至于犯错误,浪费时间和丢失信息。
进行外部审计(修正)。
数据管理:数据的处理
●数据的录入
●使用专业的数据录入程序如EpiData.
●准备
●完成代码本。
●检查问卷是否有明显的矛盾或者遗漏。
●防止错误
●创建与你的问卷类似的数据录入表。
●在录入数据之前定义有效的参数。
●由两个不同的操作员输入两套数据。
●对内容进行对比以找出不同之处(EpiInfo)对两种文件的错误进行纠正并进行新的比较。
数据的首次检查,找出错误。
●使用一个有序的命令为你的数据增加变量和值标志。
●找寻错误。
数据代码本的输出、变量的总体观察、合适数据的简单概率表。
将创建的代码本与原始的代码本相比较,观测标志信息是否是正确的。
检查产生的摘要和频率表,看看是否有参数的不合规定或不适当的最小和最大值。(比如说,年龄为250岁,男性怀孕,23岁女子的儿子年龄为19岁)。
●随机选取10%或者至少40%的问卷并将它们输入到新文件中以计算错误的概率错误纠正记录。
●如果发现了错误。
●在一个命令文件(SPSS句法文件)中进行纠正,这样能够完整地记录对数据库的改变●如果在双重录入后比较文件时发现错误。
●如果你在对两个录入文件进行比较和校正后停止这一步,你就可以对已经录入的数据进行直接改正。
错误纠正记录
●将过程分为差别明显且明确阐述的步骤,并且使你一步到另外一步的记录保持连贯
档案
●一旦你对原始数据作了最真实的记录,记得在一个安全的地方作一个备份,而用原来的记录来进行下一步工作。
分析
●确保你使用了正确的数据库。
建议创建一些用于分析的命令文件,这些命令文件的最初几个能够读取数据库。
●错误和矛盾的后期发现
备份和归档
●备份
每天都要执行
当数据破坏或者丢失的时候,可以恢复它们。
改变你的数据的数据库和命令文件,书面记录如协议,记录本和其他记录信息。
●归档
在工程进行过程中,进行一次或者几次。
目的是在更长的一段时间里保护数据和文档,甚至可能让其他的研究人员得到这些信息。